阿里巴巴团队的AgentScaler:让AI助手像人一样聪明地使用工具
这项由阿里巴巴通义实验室的方润楠、蔡世豪等研究团队领导的研究发表于2025年9月,研究论文标题为《Towards General Agentic Intelligence via Environment Scaling》。该论文已在arXiv预印本平台发布(论
模型 聪明 阿里巴巴 ai助手 agentscaler 2025-09-28 21:31 11
这项由阿里巴巴通义实验室的方润楠、蔡世豪等研究团队领导的研究发表于2025年9月,研究论文标题为《Towards General Agentic Intelligence via Environment Scaling》。该论文已在arXiv预印本平台发布(论
模型 聪明 阿里巴巴 ai助手 agentscaler 2025-09-28 21:31 11
这项突破性研究由斯坦福大学计算机科学系的Charlie Snell、Jaehoon Lee、Kelvin Xu和Aviral Kumar共同完成,并于2024年10月发表在顶级机器学习会议NeurIPS上。研究团队将这种方法称为"SpecTr"(Specula
WebWeaver的出现彻底改变了这个局面。它采用了一种全新的双智能体架构,就像为AI配备了两个专业助手:一个负责制定研究计划和收集证据的"规划师",另一个负责撰写报告的"写作者"。这种设计巧妙地模拟了人类研究员的工作流程。当一个优秀的研究员接到一个复杂课题时
洗完澡翻手机,嘿,GitHubTrending里PaddleOCR可太扎眼了:全球总榜第13、Python榜第5,Star数直接冲到55k+。
RAG(Retrieval-Augmented Generation,检索增强生成), 一种AI框架,将传统的信息检索系统(例如数据库)的优势与生成式大语言模型(LLM)的功能结合在一起。不再依赖LLM训练时的固有知识,而是在回答问题前,先从外部资料库中"翻书
近日,知名 X 博主 Tibor Blaho 发现OpenAI 正在未经用户同意的情况下,自动将 ChatGPT 用户的请求分流至两款未公开的「秘密模型」。
人工智能领域正经历一场关于技术路径的根本性分歧。图灵奖获得者、强化学习之父理查德·萨顿近日在Dwarkesh播客中明确表态,不相信扩展大语言模型能够实现类人智能,这一表态为持续数年的AGI路径争论增添了重量级声音。萨顿的观点与认知科学家加里·马库斯长期以来的立
结果一个月过去,XC70交出了3000台成绩,顶配智尊版占快一半,排产排到明年1月。
9月25日,京东集团港股盘中一度涨超7%,最终收涨3.46%,AI投资主线叙事再次强化。消息面上,9月25日,京东全球科技探索者大会(JDD)上,京东宣布,未来三年,将持续投入,带动形成万亿规模的人工智能生态。此次,京东首次系统展示了AI全景布局,不仅对“Jo
最近,DeepSeek的AI团队在知名期刊《自然》上,以封面报道的形式刊发了DeepSeek-R1的科学原理。其中“老话”重提,再一次细细地讲解了大语言模型(LLMs)不必依赖人工示例或复杂指令,也能通过试错式强化学习,自主学会生成推理过程。
模型 学习 推理 黄仁勋 deepseek团队 2025-09-28 18:03 12
大模型“精细化”对齐,真实性提升25.8%刷新SOTA北航研究团队最近在EMNLP2025上搞出个新东西,叫Token-AwareEditing,简称TAE。
9月26日,广汽传祺向往S7全新Pro+系列正式上市,共推出两款车型,售价区间为15.98万—17.98万元。新车在智能驾驶和座舱交互方面全面升级,标配可变焦激光雷达,进一步提升智能辅助驾驶能力。
社区菜馆、土菜馆、连锁(小)中餐等餐饮业态,在经济下行的当前表现亮眼,其中在微度假风潮下,具备地方特色的高性价比品牌尤其火爆,似乎成为了餐饮新周期下的流量密码。
奖励机制的设计体现了研究团队对人性化学习的深刻理解。最初,他们采用了严格的奖励标准,要求模型的预测必须与标准答案在语义上完全一致。但这种做法就像过分苛刻的考试评分标准,会抑制学生的创造性表达。经过改进,他们采用了更加灵活的"前缀奖励"机制,只要模型的预测能够合
9月28日,全球最大AI开源社区Hugging Face公布了新一期模型榜单,阿里通义7款模型入选全球前十开源模型榜单,几乎实现屠榜,其中刚刚开源的全模态大模型Qwen3-Omni登顶。
结合RLHF+RLVR,8B小模型就能超越GPT-4o、媲美Claude-3.7-Sonnet。
提起阿里巴巴,多数人首先想到的是淘宝的商品琳琅、双十一的交易狂欢或是支付宝的便捷支付。这些电商场景确实深刻影响了我们的生活,但这只是阿里的一面。如今再为这家企业贴标签,“科技”远比“电商”更为精准,其隐藏的技术实力早已构建起令人瞩目的科技版图。
Google DeepMind 近日发表了一篇论文,详细介绍了其生成式视频模型 Veo 3所展现出的“零样本”学习与推理能力,并提出了一个与大型语言模型中的“思维链”相对应的核心概念——“帧链”(CoF,Chain-of-Frames)。研究团队通过对超过 1
“京东不片面追求运动式的AI,追求的是可持续发展、真正为产业创造价值的AI。”京东集团CEO许冉道出了京东AI战略的底层逻辑。在她看来,AI不应只是一时的热闹与喧嚣,而应有着长远的规划和实实在在的产业贡献。
根据商业和技术洞察公司Gartner近期发布的预测,全球对人工智能(AI)的支出预计将在2025年达到近1.5万亿美元,较2024年大幅增长50%;到2026年,这一数字有望攀升至2万亿美元,实现37%的进一步提升。